ANÁLISIS BIOINFORMÁTICO DE UNA SECUENCIA NO ANOTADA (Secuencia # 3)
ARCILLA ALLER, FRANCISCO
Dpto. Microbiología, Universidad León
Origen de la secuencia, primeros análisis:
Microorganismo en cuestión: una especie del género Rhodococcus, comenzamos una primera aproximación con el programa Nebcutter 2.0 y obtenemos marcos de lectura(ORF):
Tenemos que es Rhodococcus erythropolis, con seguridad de que no fallo de 4x10-84. No es esa especie
LOCUS YP_002764705 250 aa linear BCT 07-MAY-2009
DEFINITION IclR family transcriptional regulator [Rhodococcus erythropolis
PR4].
ACCESSION YP_002764705
VERSION YP_002764705.1 GI:226304747
DBLINK Project:[[http://www.ncbi.nlm.nih.gov/sites/entrez?db=genomeprj&cmd=Retrieve&dopt=Overview&list_uids=20395|20395]]
DBSOURCE REFSEQ: accession [[http://www.ncbi.nlm.nih.gov/nuccore/226303489|NC_012490.1]]
KEYWORDS .
SOURCE Rhodococcus erythropolis PR4
ORGANISM [[http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=234621|Rhodococcus erythropolis PR4]]
Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales;
Corynebacterineae; Nocardiaceae; Rhodococcus.
Análisis informático de la secuencia con el programa Artemis:
Artemis Overview of: Mi secuencia.txt ORFS_100+
Número de bases: 17000
Genes (CDS features without a /pseudo qualifier):
non-spliced:
count: 84
bases: 67477
density: 4.941 genes per kb (202 bases per gene)
average length: 803
average length (including introns): 803
coding percentage: 396.9
coding percentage (including introns): 396.9
Composición de las secuencias génicas:
A content: 10487 (15.54%)
C content: 23412 (34.69%)
G content: 23227 (34.42%)
T content: 10351 (15.34%)
(no ambiguous bases) % G+C: 69.12
Overall sequence composition:
A content: 2606 (15.32%)
C content: 5718 (33.63%)
G content: 5970 (35.11%)
T content: 2706 (15.91%)
(no ambiguous bases)
GC percentage: 68.75
Summary of the active entries:
CDS: 84
Todos los posibles marcos de lectura abiertos de la secuencia
De los 84 ORFs los siguientes corresponden a secuencias conocidas:
Dirección 5'-3'
Cadena complementaria
CDS posición
Proteína
3760-4293
Inhibidor de inicio de traducción
1046-1450
Proteína hipotética
4642-6882
Regulador transcripcional IclR
2496-3158
Regulador transcripcional (TetR)
11908-14151
Oxidorreductasa
4026-4637
Regulador transcripcional
1499-2731
Esterasa-lipasa
7006-8688
Oxidasa de L-aminoácidos
3240-3977
Proteína hipotética
8108-9592
Translocasa de proteínas
5385-7049
Transportador de aminoácidos
8646-9392
Endoribonucleasa L-PSP
10273-11733
Transportador MFS
11923-14076
Proteína hipotética conservada
14286-17000
Sub grande de Glu Sintasa
Hemos elegido la Glutamato sintasa
Análisis del gen que codifica para la proteína.
Usando el programa FramePlot: ( para qué usa ahora este programa?????)
Este programa se emplea únicamente con microorganismos de alto contenido de G+C, como es el caso y no da información acerca de la capacidad codificadora, en este caso
se trata de un buen marco de lectura (línea 1).
Diseño de primers para la amplificación del gen/es por PCR:
Los oligos apropiados para la amplificación del gen serían los siguientes, según el programa Primer3 (v. 4.0) son los siguientes:
Oligo izquierdo:
Oligo
comienzo
longitud
Tm
% GC
3' sec
Izquierdo
604
20
60.43
50.00
2.00
ACGTTCCGTCAGGTGTTCAT
Derecho
838
20
60.01
60.00
2.00
CCTGCAGGTCGAGGTAGAAG
Tamaño secuencia: 2715
Tamaño producto: 235 (la proteína tiene 905 aa, y Ud. está amplificando 235???????)
Además nos proporciona algunos oligos adiccionales:
ADDITIONAL OLIGOS
[[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_START|start]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_LEN| len]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_TM| tm]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_GC| gc%]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_ANY| any]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_REPEAT| 3']] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_OLIGO_SEQ|seq]]
1 LEFT PRIMER 2168 20 59.58 60.00 4.00 1.00 GTACCAAGGTCGGTCTCGTC
RIGHT PRIMER 2388 20 59.98 50.00 4.00 1.00 CTTCGACATCACCTTCAGCA
PRODUCT SIZE: 221, PAIR ANY COMPL: 6.00, PAIR 3' COMPL: 2.00
2 LEFT PRIMER 748 20 59.73 60.00 4.00 1.00 GTGTACTTCCCGAGCCTGTC
RIGHT PRIMER 897 20 59.70 55.00 2.00 2.00 GAAGGTGTTGGTGGAGAAGC
PRODUCT SIZE: 150, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 3.00
3 LEFT PRIMER 2168 20 59.58 60.00 4.00 1.00 GTACCAAGGTCGGTCTCGTC
RIGHT PRIMER 2387 20 59.84 50.00 4.00 0.00 TTCGACATCACCTTCAGCAC
PRODUCT SIZE: 220, PAIR ANY COMPL: 6.00, PAIR 3' COMPL: 3.00
4 LEFT PRIMER 604 20 60.43 50.00 4.00 2.00 ACGTTCCGTCAGGTGTTCAT
RIGHT PRIMER 837 20 60.16 60.00 6.00 2.00 CTGCAGGTCGAGGTAGAAGC
PRODUCT SIZE: 234, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 1.00
Diseño de primers para amplificar fragmentos internos del gen/es y comprobar si dicho gen/es son esenciales o no para el microorganismo.
Para comprobar si se trata de un gen esencial para el microorganismo se puede realizar un experimento de interrupción génica dentro de esa secuencia.(Hágalo....)
A continuación obtuvimos el péptido líder, empleando el programa SignalP 3.0 Server de la Universidad Técnica de Dinamarca:
La predicción está basada en el modelo HMM (Hidden Markov Models) para Gram+:
[[code]]
>CDS
Prediction: Signal peptide
Signal peptide probability: 0.672
Max cleavage site probability: 0.532 between pos. 22 and 23
Diseño de primers para amplificar los genes que codifican para la/s proteína/s de interés con colas de histidina para su rápida purificación
Empleamos un vector pET-28a de Novagen que lleva incorporadas colas de His, empleamos para introducirlo en el microorganismo una enzima de restricción presente en el vector
y que corte en un sitio cercano al gen para luego clonarlo. Los primers serán los mismos que para clonar por PCR.
Las enzimas de restricción que cortan en esta secuencia, a partir del programa Nebcutter son: (para que???)
Realización de una mutagénesis in vitro del gen Glut Sintasa (porqué ha elegido esta mutación?????)
Los primers elegidos son:
Oligo izquierdo: ACGTTCCGTGTGGTGTTCAT
Oligo derecho: CCTGCAGGTTGAGGTAGAAG
ANÁLISIS DE LA PROTEÍNA GLUTAMATO SINTASA:
En primer lugar hallamos la familia de proteínas a las que pertenece:
Se completa información con el KEGG (Kyoto Encyclopedia of Genes and Genomes):
Familia de las Oxidoreductasas;
Actúan en el grupo donador CH-NH2 y utilizan NAD+ o NADP+ como aceptor.
Localización más probable de la proteína; empleando el programa PSORTb version 2.0.4 obtenemos lo siguiente:
Cytoplasmic 8.87
CytoplasmicMembrane 0.39
Cellwall 0.01
Extracellular 0.73
Final Prediction: Cytoplasmic 8.87 Así pues, se trata de una proteína citoplasmática, como era de esperar.
Ruta metabólica en la que participa:
Corte con peptidasas , con ExPasy Peptide Cutter se obtienen los siguiente sitios de corte:
Propiedades fisico-químicas de la proteína (ExPaSy ProtParam tool):
**Número de aminoácidos:** 905
**Peso molecular:** 98552.6
**pI teórico:** 5.27
Composition de aminoácidos:
Ala (A) 93 10.3%
Arg (R) 55 6.1%
Asn (N) 24 2.7%
Asp (D) 55 6.1%
Cys (C) 6 0.7%
Gln (Q) 31 3.4%
Glu (E) 64 7.1%
Gly (G) 79 8.7%
His (H) 28 3.1%
Ile (I) 37 4.1%
Leu (L) 87 9.6%
Lys (K) 29 3.2%
Met (M) 22 2.4%
Phe (F) 33 3.6%
Pro (P) 49 5.4%
Ser (S) 54 6.0%
Thr (T) 47 5.2%
Trp (W) 9 1.0%
Tyr (Y) 23 2.5%
Val (V) 80 8.8%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%
Total de residuos cargados negativamente (Asp + Glu): 119 Total de residuos cargados positivamente (Arg + Lys): 84
Composición atómica:
Carbon C 4370
Hydrogen H 6871
Nitrogen N 1219
Oxygen O 1323
Sulfur S 28
Formula: C4370H6871N1219O1323S28 Total de átomos: 13811
Índice de estabilidad: 33.71; la proteína es estable.
Índice alifático: 89.35
Hidrofobicidad (GRAVY): -0.148
Aparecen algunos dominios coiled-coil: (no son dominios coiled-coils)
Análisis filogenético. (donde está su secuencia??? el arbol no se entiende si no pone los nombres de las especies...)
Con el programa ClustalW y Mega 4.1 obtuvimos un dendrograma Neighbour-joining de la proteína comparada con otras similares:
Informe final: muy pobre y sin bibliografía)
Se ha realizado un estudio bioinformático de parte de una secuencia de un microorganismo que ha resultado ser del género rhodococcus. De esta secuencia de 17000pb
hemos obtenido mediante el programa Artemis los ORFs, todos los cuales (de un mínimo de 100pb) hemos verificado la proteína para la cual codifican, de los 84 obtenidos inicialmente
únicamente 15 codificaban para alguna proteína (al menos con la información de la bate de datos actual (BLAST).
De dichas proteínas hemos centrado el estudio en la Glutamato Sintasa (subunidad grande), proteína que interviene en la siguiente reacción:
2 L-glutamate + NADP+ = L-glutamine + 2-oxoglutarate + NADPH + H+ (porqué no define los números C00025, c0005....)
Se trata de una proteína perteneciente a la familia de las oxidorreductasas y contiene un dominio GATasa 2 y otro Glu sintasa central (Pfam, Sanger Institute y KEGG).
Es una flavoproteína Hierro-Azufre, en la reacción inversa puede actuar el amonio en lugar de la glutamina pero más lentamente.
Interviene en el metabolismo del Glutamato, Nitrógeno y en otras vías metabólicas.
Se confirmó que en efecto se trata de una proteína citoplasmática [PSORTb v.2.0: J.L. Gardy, M.R. Laird, F. Chen, S. Rey, C.J. Walsh, M. Ester, and F.S.L. Brinkman (2005)].
Es además una proteína hidrófila con mayor contenido de cargas negativas.
En el análisis de la secuencia proteica se obtuvo que es cortado con un gran número de peptidasas y contiene algún dominio coiled-coil [COILS, Lupas, A., Van Dyke, M., and Stock, J. (1991)].
Asimismo se obtuvo un %G+C en la secuencia de 67.8 [FramePlot 2.3.2].
Bibliografía:
Applied and Environmental Microbiology, April 2001, p. 1412-1417, Vol. 67, No. 4
Muscatello, G., Gilkerson, J. R., Browning, G. F. (2009). Detection of Virulent Rhodococcus equi in Exhaled Air Samples from Naturally Infected Foals. J. Clin. Microbiol. 47: 734-737
Agradecimientos:
Al departamento de Microbiología de la Universidad de León y al Dr. J. Antonio Gil
ANÁLISIS BIOINFORMÁTICO DE UNA SECUENCIA NO ANOTADA (Secuencia # 3)
ARCILLA ALLER, FRANCISCODpto. Microbiología, Universidad León
Origen de la secuencia, primeros análisis:
Microorganismo en cuestión: una especie del género Rhodococcus, comenzamos una primera aproximación con el programa Nebcutter 2.0 y obtenemos marcos de lectura(ORF):
Tenemos que es Rhodococcus erythropolis, con seguridad de que no fallo de 4x10-84. No es esa especie
LOCUS YP_002764705 250 aa linear BCT 07-MAY-2009 DEFINITION IclR family transcriptional regulator [Rhodococcus erythropolis PR4]. ACCESSION YP_002764705 VERSION YP_002764705.1 GI:226304747 DBLINK Project:[[http://www.ncbi.nlm.nih.gov/sites/entrez?db=genomeprj&cmd=Retrieve&dopt=Overview&list_uids=20395|20395]] DBSOURCE REFSEQ: accession [[http://www.ncbi.nlm.nih.gov/nuccore/226303489|NC_012490.1]] KEYWORDS . SOURCE Rhodococcus erythropolis PR4 ORGANISM [[http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=234621|Rhodococcus erythropolis PR4]] Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Nocardiaceae; Rhodococcus.Reino: Bacteria
Phylum: Actinobacteria
Clase: Actinobacteria
Subclase: Actinobacteridae
Orden: Actinomycetales
Suborden: Corynebacterineae
Familia: Nocardiaceae
Géneros: Rhodococcus
Análisis informático de la secuencia con el programa Artemis:
Artemis Overview of: Mi secuencia.txt ORFS_100+
Número de bases: 17000
Genes (CDS features without a /pseudo qualifier):
non-spliced:
count: 84
bases: 67477
density: 4.941 genes per kb (202 bases per gene)
average length: 803
average length (including introns): 803
coding percentage: 396.9
coding percentage (including introns): 396.9
Composición de las secuencias génicas:
A content: 10487 (15.54%)
C content: 23412 (34.69%)
G content: 23227 (34.42%)
T content: 10351 (15.34%)
(no ambiguous bases)
% G+C: 69.12
Overall sequence composition:
A content: 2606 (15.32%)
C content: 5718 (33.63%)
G content: 5970 (35.11%)
T content: 2706 (15.91%)
(no ambiguous bases)
GC percentage: 68.75
Summary of the active entries:
CDS: 84
De los 84 ORFs los siguientes corresponden a secuencias conocidas:
Análisis del gen que codifica para la proteína.
Usando el programa FramePlot: ( para qué usa ahora este programa?????)
Este programa se emplea únicamente con microorganismos de alto contenido de G+C, como es el caso y no da información acerca de la capacidad codificadora, en este caso
se trata de un buen marco de lectura (línea 1).
Los oligos apropiados para la amplificación del gen serían los siguientes, según el programa Primer3 (v. 4.0) son los siguientes:
Oligo izquierdo:
Tamaño producto: 235 (la proteína tiene 905 aa, y Ud. está amplificando 235???????)
Además nos proporciona algunos oligos adiccionales:
ADDITIONAL OLIGOS [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_START|start]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_LEN| len]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_TM| tm]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_GC| gc%]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_ANY| any]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_REPEAT| 3']] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_OLIGO_SEQ|seq]] 1 LEFT PRIMER 2168 20 59.58 60.00 4.00 1.00 GTACCAAGGTCGGTCTCGTC RIGHT PRIMER 2388 20 59.98 50.00 4.00 1.00 CTTCGACATCACCTTCAGCA PRODUCT SIZE: 221, PAIR ANY COMPL: 6.00, PAIR 3' COMPL: 2.00 2 LEFT PRIMER 748 20 59.73 60.00 4.00 1.00 GTGTACTTCCCGAGCCTGTC RIGHT PRIMER 897 20 59.70 55.00 2.00 2.00 GAAGGTGTTGGTGGAGAAGC PRODUCT SIZE: 150, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 3.00 3 LEFT PRIMER 2168 20 59.58 60.00 4.00 1.00 GTACCAAGGTCGGTCTCGTC RIGHT PRIMER 2387 20 59.84 50.00 4.00 0.00 TTCGACATCACCTTCAGCAC PRODUCT SIZE: 220, PAIR ANY COMPL: 6.00, PAIR 3' COMPL: 3.00 4 LEFT PRIMER 604 20 60.43 50.00 4.00 2.00 ACGTTCCGTCAGGTGTTCAT RIGHT PRIMER 837 20 60.16 60.00 6.00 2.00 CTGCAGGTCGAGGTAGAAGC PRODUCT SIZE: 234, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 1.00Empleamos también Primer3plus:
Otros oligos:
Para comprobar si se trata de un gen esencial para el microorganismo se puede realizar un experimento de interrupción génica dentro de esa secuencia.(Hágalo....)
La predicción está basada en el modelo HMM (Hidden Markov Models) para Gram+:
Empleamos un vector pET-28a de Novagen que lleva incorporadas colas de His, empleamos para introducirlo en el microorganismo una enzima de restricción presente en el vector
y que corte en un sitio cercano al gen para luego clonarlo. Los primers serán los mismos que para clonar por PCR.
Las enzimas de restricción que cortan en esta secuencia, a partir del programa Nebcutter son: (para que???)
Los primers elegidos son:
Oligo izquierdo: ACGTTCCGTGTGGTGTTCAT
Oligo derecho: CCTGCAGGTTGAGGTAGAAG
En primer lugar hallamos la familia de proteínas a las que pertenece:
Programa Pfam
Secuencia de la proteína:
PSETPQSNVAGADVSPVPRLNEEPFSVGAAQCRAGTCSAVVWPSALLVVGASTHTKAVGMKHLPGPQGLYHPA
NEHDACGVAFVVDMHGRRSRDIVEKAITALVNLEHRGAAGSEPNTGDGAGILLQVPDRFLRAVVDFELPAAGA
YATGIAFLPQGDAAADEAAAGVEKIVAEEGLTVLGWREVPTDDSSLGTLARAAMPTFRQVFIGSAGDSVTDMD
LERRAYVIRKRVEHELGESGAGEDGPGRESVYFPSLSGQTFVYKGMLTTPQLKGFYLDLQDDRVESALGLVHS
RFSTNTFPSWPLAHPFRRVAHNGEINTVSGNENWMRAREALIKSDVFGDGALEKIFPICTPGASDTARFDEVL
ELLHLGGRSLPHAVLMMIPEAWERHESMDPARKAFYEYHSALMEPWDGPASVCFTDGTVVGAVLDRNGLRPSR
VWVTDDGLVVMASEVGVLDIAPEKIVRRMRMQPGRMFLVDTAQGRIISDDEIKSELAAEHPYQQWIDEGLVQI
DDLPESKYTYMTHDRVVLRQQIFGFTNEEVNLLVKPMAVTGGEALGSMGTDTPIAVLSARPRMLFDYFQQLFA
QVTNPPLDAIREEIVTSLGGTIGPEADLLTPSAASCRQIVLPQPILHNDDLSKLIHLNDNAKFPHFRSVVVRG
VYPVAQGGEGLRKALDTVRDKVSEAIAGGARIIVLSDRESNEKYAPIPSLLLTAAVHHHLVREKTRTKVGLVV
ESGDAREVHHMAALLGFGASAVNPYMAFETIDELLQSNQLAGLSLDKAVTNYIKAAGKGVLKVMSKMGISTLA
SYTGAQLFQVIGLSQELVDEYFTGLQSNLDGIGLDEIAADVAARHANAYLDRPELRAHRELEVGGEYQWRREG
EYHLFNPDTVFKLQHSTKTGQYEVFKEYT
Se obtienen dos resultados significativos según los cuales esta proteína contiene un dominio GATasa 2 y otro Glu sintasa central:
Familia de las Oxidoreductasas;
Actúan en el grupo donador CH-NH2 y utilizan NAD+ o NADP+ como aceptor.
Cytoplasmic 8.87
CytoplasmicMembrane 0.39
Cellwall 0.01
Extracellular 0.73
Final Prediction:
Cytoplasmic 8.87 Así pues, se trata de una proteína citoplasmática, como era de esperar.
Ruta metabólica en la que participa:
Composition de aminoácidos:
Ala (A) 93 10.3%
Arg (R) 55 6.1%
Asn (N) 24 2.7%
Asp (D) 55 6.1%
Cys (C) 6 0.7%
Gln (Q) 31 3.4%
Glu (E) 64 7.1%
Gly (G) 79 8.7%
His (H) 28 3.1%
Ile (I) 37 4.1%
Leu (L) 87 9.6%
Lys (K) 29 3.2%
Met (M) 22 2.4%
Phe (F) 33 3.6%
Pro (P) 49 5.4%
Ser (S) 54 6.0%
Thr (T) 47 5.2%
Trp (W) 9 1.0%
Tyr (Y) 23 2.5%
Val (V) 80 8.8%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%
Total de residuos cargados negativamente (Asp + Glu): 119
Total de residuos cargados positivamente (Arg + Lys): 84
Composición atómica:
Carbon C 4370
Hydrogen H 6871
Nitrogen N 1219
Oxygen O 1323
Sulfur S 28
Formula: C4370H6871N1219O1323S28
Total de átomos: 13811
Índice de estabilidad: 33.71; la proteína es estable.
Índice alifático: 89.35
Hidrofobicidad (GRAVY): -0.148
Análisis filogenético. (donde está su secuencia??? el arbol no se entiende si no pone los nombres de las especies...)
Con el programa ClustalW y Mega 4.1 obtuvimos un dendrograma Neighbour-joining de la proteína comparada con otras similares:
Se ha realizado un estudio bioinformático de parte de una secuencia de un microorganismo que ha resultado ser del género rhodococcus. De esta secuencia de 17000pb
hemos obtenido mediante el programa Artemis los ORFs, todos los cuales (de un mínimo de 100pb) hemos verificado la proteína para la cual codifican, de los 84 obtenidos inicialmente
únicamente 15 codificaban para alguna proteína (al menos con la información de la bate de datos actual (BLAST).
De dichas proteínas hemos centrado el estudio en la Glutamato Sintasa (subunidad grande), proteína que interviene en la siguiente reacción:
2 L-glutamate + NADP+ = L-glutamine + 2-oxoglutarate + NADPH + H+ (porqué no define los números C00025, c0005....)
Se trata de una proteína perteneciente a la familia de las oxidorreductasas y contiene un dominio GATasa 2 y otro Glu sintasa central (Pfam, Sanger Institute y KEGG).
Es una flavoproteína Hierro-Azufre, en la reacción inversa puede actuar el amonio en lugar de la glutamina pero más lentamente.
Interviene en el metabolismo del Glutamato, Nitrógeno y en otras vías metabólicas.
Se confirmó que en efecto se trata de una proteína citoplasmática [PSORTb v.2.0: J.L. Gardy, M.R. Laird, F. Chen, S. Rey, C.J. Walsh, M. Ester, and F.S.L. Brinkman (2005)].
Es además una proteína hidrófila con mayor contenido de cargas negativas.
En el análisis de la secuencia proteica se obtuvo que es cortado con un gran número de peptidasas y contiene algún dominio coiled-coil [COILS, Lupas, A., Van Dyke, M., and Stock, J. (1991)].
Asimismo se obtuvo un %G+C en la secuencia de 67.8 [FramePlot 2.3.2].
Bibliografía:
Applied and Environmental Microbiology, April 2001, p. 1412-1417, Vol. 67, No. 4
Muscatello, G., Gilkerson, J. R., Browning, G. F. (2009). Detection of Virulent Rhodococcus equi in Exhaled Air Samples from Naturally Infected Foals. J. Clin. Microbiol. 47: 734-737
Agradecimientos:
Al departamento de Microbiología de la Universidad de León y al Dr. J. Antonio Gil